Q2RL: Aprendizaje por Refuerzo en Robótica desde Clonación de Comportamiento
Aprende cómo Q2RL extrae Q-values de clonación de comportamiento para mejorar robots con RL, logrando éxito del 100% en manipulación.
Aprende cómo Q2RL extrae Q-values de clonación de comportamiento para mejorar robots con RL, logrando éxito del 100% en manipulación.